组织微生物研究面临的挑战之人类基因非特异性扩增 | 肿瘤微生物
文章题目:人类DNA的非特异性扩增是16SrRNA基因测序分析的一个主要的挑战
期刊:Scientific RepoRtS
样本类型:乳腺癌的肿瘤组织和正常组织、食管活检组织、皮肤拭子样本和粪便样本
16S rRNA基因的靶向测序是微生物生态学领域中最常用的技术之一,人体内各种生态位的细菌群落都是通过这样的方式进行研究。这种方法主要是通过靶向16S rRNA基因内的一个或多个高变(V)区域来实现的,以产生大小适合于二代测序的扩增子。到目前为止,所有的技术研究都集中在不同V区准确反应细菌群落组成的能力上。本研究提出了一个与16S rRNA相关的概念,叫人类DNA的非特异性扩增。
作者在分析特定人类位点的16S rRNA基因测序数据时发现,在进行常规的V3V4区引物扩增时,这些样本更易受到非特异性扩增的影响。接着使用V1V2区重新对这些受到严重影响的样本类型(乳腺肿瘤样本)进行分析,发现非特异性扩增的情况显著降低。本研究结果显示,使用V1V2区的引物进行人类活检样本的扩增效率更高。V1V2区引物导致人类基因组比对序列平均减少80%,从而允许对这些样本中鉴定到的细菌群落可以进行更有统计学意义的分析。
本文主要对研究16SrRNA基因测序中人类DNA非靶向扩增和发生这种扩增所需的环境,以及后续研究的影响进行探索。实际上这种情况并不是普遍存在,只有在人类DNA和细菌DNA占比比较悬殊的情况下才会出现。对于人类DNA含量少于10%和90%的粪便和皮肤样本几乎是不受影响的,但是对于人类DNA占97%的活检样本的分析会产生严重影响。在目前的微生物组研究中,来自于人体的多个部位的活检部位的样本的使用率越来越高,这个问题就是对这种研究方法的一种挑战,但是几乎很少有文献报道。
目前,16S rRNA基因中引物对和它们所针对的高变区的比较大部分集中在不同的分类分辨率和特异性水平上。到目前为止,人类来源的扩增产物在细菌分辨率上的损失程度还没有受到关注。主要是因为分析16S rRNA基因测序数据的工作流程通常会删除与序列长度的平均值或中值相差太远的reads,或者它们在分类学上没有被归类为细菌DNA的reads。这可以有效确保扩增的人类DNA的存在不会对下游分析产生任何影响。但是未解决的是,在产生有限数据量(在典型的MiSeq run9上高达15 GB)的测序实验中,由于这种非特异性扩增,很大一部分数据可能被浪费。这对测序研究主要有两方面的影响:
(1)如果明确这种数据损失,那可用于后续的分析的样本太少,会对小一点的实验室产生成本问题。
(2)如果不明确这种数据损失,可能用不充分的细菌reads来准确描述被测序的样本的特征,特别是如果试图说明不同处理组之间稀有类群存在的原因时。
图1
图1A展示从活检组织中提取的DNA中人类宿主DNA占很大的比例,V3V4区的简并引物(黄色)不仅可以结合细菌DNA(蓝色),也可以和人类线粒体DNA(红色)结合,很容易存在非特异性扩增,而V1V2区的简并引物(绿色)只能特异性结合细菌16S rRNA基因,几乎没有存在非特异性扩增。
图1B展示了这种非特异性扩增显著改变了样本的16S rRNA基因测序图谱。
当使用V3-V4引物扩增时,三个宿主DNA占比较高的活检部位的样本(乳腺、乳腺肿瘤和食道)都显示出显著的非特异性扩增(图2)。在对人类DNA含量较低的样本(如皮肤拭子和粪便样本)进行测序时,这一点并不明显。使用Bowtie2进行分析时,在正常乳腺组织样本中检测到的所有扩增序列变异(ASV),平均有34.1%与人类基因组GRCh38一致。
图2 各样本人类基因reads占比情况
在用ASV序列BLAST时,比对到了智人单倍体H8线粒体全基因组(Homo sapiens haplogroup H8 mitochondrion,Accession no. MN986463.1),E-value为7e − 138,identity为100%。在乳腺肿瘤样本中,检测到的所有ASV中有77.2%与人类基因组序列一致,其中ASV再次比对为智人单倍体H8线粒体全基因组(MN986463.1),E-value为7e − 138,identity为100%。这种情况在食道活检中同样存在,55.6%的ASV比对到了人类基因组(智人单倍组H8线粒体的完整基因组(MN986463.1),E值为7E−138,Identity为100%。皮肤拭子样本显示出人类DNA的扩增水平要低得多,扩增出的这些resds与染色体DNA一致,最常见的是智人17号染色体(lone RP11-646F1),但是水平非常低。
16SrRNA测序由于使用细菌/古菌的特异性引物,所以很少有人报道从测序中人类DNA污染的问题。然而16SrRNA测序使用的简并引物,这样不仅允许细菌DNA与引物匹配,还允许了人类DNA与引物的匹配(见图1A)。在细菌DNA和宿主DNA占比比较悬殊的情况下,使用16SrRNA引物是可以扩增出人类线粒体DNA的。为了确保结果的有效性,通过RDP数据库上的Mothur21分类器对之前用Bowtie2与人类基因组比对一致的reads进行了分类。发现与人类基因组比对一致的reads都不能被分类,界水平unclassified比例达到了98%以上,如下面的表3所示。
表3 各样本物种分类unclassified比例情况
通过对用V3-V4和V1-V2引物扩增的样本进行配对比较,重新分析了研究中受影响最严重的样本类型(乳腺肿瘤组织)。
图3
注:A图为去除人类基因前的稀释曲线;B图为去除人类基因后的稀释曲线
上图中展示了V3V4区和V1V2区引物扩增的乳腺肿瘤组织的稀释曲线,可以看到两者之间是有明显区别的。去除人类基因后,可以看到V1V2区 的引物结果鉴定到更多的物种,而且每个样本的序列数目也更多,这样就有足够多的序列保证测序数据量的合理性来反应样本的真实情况。
图4
注:图4A展示了采用不同引物扩增的各样本之间的物种组成情况;图4B展示了采用不同引物的shannon指数差异情况;图4C展示了采用不同引物的比对到人类基因的reads数的差异情况
用V1-V2引物扩增的样本群落结构与用V3-V4引物扩增的样本群落结构在视觉上相似。但是通过进行Wilcoxon符号秩检验,发现其中一组引物科水平物种丰度没有明显差异。Alpha多样性分析的Shannon指数比较结果也没有显著差异(图4B),说明引物的选择对下游分析结果没有任何不利影响。对低生物量的研究来说,一旦人类基因污染被过滤掉,数据量会产生巨大差异。从图4C中可以看出,使用引物对V1-V2区域进行扩增的样本,在去除人类基因的ASV后,每个样本的ASV数量都持续显著增加。
目前已有 Nanopore和 Pacbio的三代测序平台用于16SrRNA测序。其中Pacbio测序技术与去噪算法结合的“Circular Consensus Sequencing”的技术允许产生更多高质量的长序列。但是Earl等人的研究表明,这种利用简并引物靶向整个16S rRNA基因的新方法,仍然导致了人类基因的非特异性扩增。本研究还发现,这种非特异性扩增与人类DNA与细菌DNA的比例有关。无论是现在还是将来,在设计或选择引物时都必须考虑到人类基因。
编者语:
遇到这种情况,难道我们就束手无策了吗?当然不是,既然我们已经知道了,这些非特异性扩增的存在,那我们就可以从两个方面着手:一方面是在PCR扩增后,对扩增文库进行目的片段的割胶回收。另一方面,我们也可以在数据预处理过程中对测序片段进行长度过滤,以减少用于后续分析的ValidData中短序列的占比,当然,选择这种方法,首先要保证过滤完短序列后仍然有足够的数据量满足后续分析要求。以上两种方法不管是哪一种,都可以有效减少人类基因对分析结果的影响。做到这些就万无一失了吗?不,我们还需要注意是否有污染菌的存在。解决这个问题,在实验环节要尽量避免污染,如果在测序数据中发现了一些已报道的常见的肿瘤微生物研究中的污染菌(做肿瘤微生物检测,这些检出的菌可能来自污染!| 肿瘤微生物),我们也要从测序数据中过滤掉这部分序列,这样才能最大可能的体现样本的真实情况。
说到这里,如果您也有做肿瘤微生物检测的打算,做之前,不妨先看看这两篇文章吧!(做肿瘤微生物检测,这些实验设计你都知道吗?| 肿瘤微生物)(做肿瘤微生物检测,这些问题需重视! | 肿瘤微生物)
参考文献:[1]Earl, J. P . et al. Species-level bacterial community profiling of the healthy sinonasal microbiome using Pacific Biosciences sequenc-ing of full-length 16S rRNA genes. Microbiome 6(1), 190 (2018).[2]Nejman D, Livyatan I.et al. The human tumor microbiome is composed of tumor type-specific intracellular bacteria. Science. 2020 May 29;368(6494):973-980. doi: 10.1126/science.aay9189. PMID: 32467386; PMCID: PMC7757858.
除了测序,还有哪些方法能证实肿瘤组织中存在微生物?| 肿瘤微生物
Science:1526份7类肿瘤组织实证肿瘤细胞和免疫细胞中存在细菌 | 微生物专题
Nature:Rob Knight团队发现血液和组织微生物组可诊断癌症|微生物专题
Nature:黑色素瘤内细菌来源的多肽或是免疫治疗新靶点 | 肿瘤微生物
点击下方图片进入云平台资料汇总:
所见即所得,figure有bi格
联川云平台,让科研更自由